El sexo como principal factor detrás de las víctimas de trata de personas en el Perú en 2017.
Pregunta de investigación: ¿Qué factores influyen en las tasas de trata de personas en el Perú en 2017?
Usamos el comando str para solicitar la estrura de las variables
'data.frame': 24 obs. of 12 variables:
$ ...1 : chr "Amazonas" "Ancash" "Apurimac" "Arequipa" ...
$ MUJERES : chr "49.3" "50.4" "50.2" "50.6" ...
$ INMIGRANTES : num NA NA 0.5 2.8 0.8 1.3 1.8 0.3 1.2 2.8 ...
$ EMIGRANTES : num 2.4 6.8 3.8 2.9 5 10.7 5.3 4.8 4.9 2.4 ...
$ URBANO : num 45 61 40 90 55 35 56 23 39 92 ...
$ RURAL : num 55 39 60 10 45 65 44 77 61 8 ...
$ SOCIOECO_MUYBAJO: num 67.7 46.5 74.3 17.5 71.2 69.4 58.1 83 66.7 13.4 ...
$ ASISTENCIA_SEC : num 80.8 86.1 88 90.5 86.5 81.5 84.7 87.4 77.4 90.6 ...
$ PEAOCUPADA_FEM : num 48.8 48.3 51.8 46.6 49.9 51.6 50.2 54.8 49.3 43.1 ...
$ CASOSCEM : num 1200 3883 1706 9532 3050 ...
$ ASISTENCIA_SUP : num 61.1 59.4 79.9 83.3 53.6 48.9 84.3 58.4 56.6 69 ...
$ VICTIMAS : num 20 20 3 70 26 18 45 13 11 17 ...
Número de víctimas de trata de personas por departamentos del Perú en el 2018 y es una variable cuantitativa discreta.
Ahora analicemos las medidas de tendencia central, de dispersión y de posición. ¿Qué podemos comentar de los datos obtenidos?
3 4 11 13 17 18 20 21 22 26 43 45 48 53 65 70 71 88 235
2 1 1 1 3 1 2 1 1 1 1 2 1 1 1 1 1 1 1
De la tabla se puede afirmar que la moda es 17. Es decir, el número de víctimas de trata de presonas en el 2017 que ocurre con mayor frecuencia es 17, la cual corresponde a la cantidad registrada en los departamento de Ucayali, Ica y Lambayaque.
Basta que algún dato dentro de la muestra sea muy alto o muy bajo, el promedio se verá alterado. Esto vemos ocurre con el caso de Lima que cuenta con un número de víctimas de trata de personas en el 2017 muy alto (235), en comparación a los demás departamentos.
Mínimo Media Mediana Desviación Máximo
1 3 40.625 21.5 47.75555 235
Este resultado quiere decir que el número promedio aproximado de víctimas de trata de personas en el 2017 de todos los departamentos del Perú analizados es 41.
En segundo lugar, calculamos la mediana porque esta medida es más robusta que la media al resistir valores extremos. Se observa que la mitad de departamentos analizados tienen aproximadamente hasta 22 víctimas de trata de personas en el 2017.}
La desviación estándar es una medida que nos ayuda a entender cuánto se separan los números en un conjunto de datos del valor promedio o medio. Podemos traducir ello como una forma de medir cuánto “se dispersan” los números alrededor de un número central. En este caso, la desviación es de 47.76 esto quiere decir que cada departamento se encuentra en promedio a 7 puntos de la media.
Adicionalmente, podemos afirmar que el número mínimo de víctimas de trata de personas en el 2017 en todos los departamentos del Perú es de 3 (del departamento de Apurímac) y el número máximo es 235 (correspondiente al departamento de Lima).
A continuación, graficamos. Como la variable VICTIMAS es numérica, esta vez realizaremos un histograma.
El histograma muestra una distribución asimétrica hacia la derecha. Esto quiere decir que existe una concentración de datos hacia la derecha.
Analicemos las medidas de posición y grafiquemos Q1 Q3
1 17 49.25
Generamos el gráfico que mejor permite ver estas medidas de posición
Como ya sabemos la mediana es 21.5
El gráfico facilita la visualización de la dispersión de los datos. En el caso de la variable dependiente, se observa poca dispersión debido al pequeño tamaño de la caja. En otras palabras, dentro de los departamentos, la mayoría registra (50% entre Q1 y Q3) como número de víctimas de trata de personas en el 2017 entre 17 y 50 personas. Además, podemos afirmar respecto del número de víctimas de trata de personas en el 2017 por departamentos, que el 75% de sus datos superiores por poco no superan las 50 víctimas (Q3= 49.25).
Se identifica un valor atípico que corresponde al departamento de Lima con 235 vícitmas de trata de personas (los outliers se muestran como puntos individuales más allá del bigote de la caja).
Min Media Mediana Desviación Max Q1 Q3
1 47.2 49.99583 50.2 0.912464 51.2 49.3 50.6
Este resultado quiere decir que el porcentaje promedio de habitantes de sexo femenino en el 2017 de todos los departamentos analizados es de casi 50 (49.96). Igualmente, la mediana está muy cerca del 50%, lo cual nos indica que no hay datos extremos que alteren el promedio.Además, quiere decir que, hasta la mitad de departamentos analizados tienen una población de habitantes de sexo femenino de hasta 50%. Un rango pequeño de valores mínimos y máximos (47.2 y 51.2) indica que la mayoría de los valores se agrupan en el centro de la distribución.
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
Si la distancia entre Q1 y Q3 es pequeña, esto indica que la distancia
entre los valores más bajos y más altos es pequeña.
Asimismo, Q1 = 49.3 y Q3 = 50.6 es un rango pequeño, lo que sugiere que hay poca variación en los datos y los valores se agrupan cerca de la mediana (50.2).Ademá, se detecta la presencia de un dato atípico que es el caso de Madre de Dios, el cual cuenta con 47.2% de habitantes de sexo femenino.
Realizamos un histograma porque es una variable numérica
El histograma muestra una distribución asimétrica sesgada con ligero
sesgo negativo o a la izquierda. Esto quiere decir que existe una
concentración de datos hacia la derecha.
Ahora se realizará el análisis que corresponde entre dos variables numéricas. La correlación es una medida de la relación (covariación) entre dos variables cuantitativas y la manera más sencilla de saber si dos variables están correlacionadas (varían conjuntamente).
Hipótesis de la prueba de correlación H0: No existe correlación entre el número de víctimas de trata de personas en el 2017 y el porcentaje de habitantes de sexo femenino que hay en cada departamento.
Pearson's product-moment correlation
data: data$VICTIMAS and data$MUJERES
t = 0.46637, df = 22, p-value = 0.6455
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.3171117 0.4830583
sample estimates:
cor
0.09894186
El Coeficiente de Correlación Lineal de Pearson mide la dirección y la fuerza de la relación lineal que existe entre dos variables cuantitativas. Dado que el p-valor es mayor a 0.05, aceptamos la hipótesis nula. Por lo tanto, podemos afirmar que no existe correlación entre el número de víctimas de trata de personas en el 2017 y el porcentaje de habitantes de sexo femenino que hay en cada departamento.
Min Media Mediana Desviación Max Q1 Q3
1 0.3 3.931818 1.5 10.376 50.1 0.825 2.8
Un rango muy amplio (de 0.3 a 50.1) sugiere que hay mucha variación en los datos, desde los departamentos con un bajo porcentaje de inmigrantes hasta aquellos con un alto porcentaje de inmigrantes.
Una media de 3.93 y una mediana de 1.5 indican que hay muchos departamentos con un bajo porcentaje de población inmigrante (la población inmigrante tiende a estar concentrada en departamentos donde el porcentaje de inmigrantes es bajo)
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
La distancia entre Q1 y Q3 es pequeña, lo que significa que hay poca
variación en el rango del porcentaje de inmigrantes entre Q1 y Q3.
Hay un punto afuera de la caja, que pertenece al departamento que tiene un muy alto porcentaje de inmigrantes (Lima con el 50.2%), por lo que es muy diferente de la mayoría de los otros departamentos en términos del porcentaje de inmigrantes.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas. Esta “nube” de puntos en el gráfico de dispersión nos da una idea visual de la probable relación entre las variables.
El gráfico nos indica una correlación positiva.Reallizaremos la prueba
de correlación para saber la fuerza de la correlación
Hipótesis de la correlación H0 = No existe correlación entre el porcentaje de población inmigrante según departamento de nacimiento y el número de víctimas de trata de personas en el 2017.
Pearson's product-moment correlation
data: data$VICTIMAS and data$INMIGRANTES
t = 7.7734, df = 20, p-value = 1.812e-07
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.7015668 0.9435735
sample estimates:
cor
0.8667904
Como el p-valor es menor a 0.05, rechazamos la H0. Por lo tanto, podemos afirmar que existe correlación entre el porcentaje de población inmigrante según departamento de nacimiento y el número de víctimas de trata de personas en el 2017.
El coeficiente es de 0.87, lo que quiere decir: (i) Se trata de una correlación positiva; es decir, relación directa (+) y (ii) Según los criterios de Cohen (1988), se trata de una correlación grande. En síntesis, se espera que mientras más elevado sea el porcentaje de población inmigrante según departamento de nacimiento, mayor será el número de víctimas de trata de personas.
Aunque en el gráfico de dispersion no se observaba la tendencia de manera clara, sabemos que se trata de una relación fuerte y suficientemente significativa para ser considerada relevante.
No obstante, la correlación fuerte no significa que el porcentaje de inmigrantes sea la única causa del número de víctimas de trata de personas. Podrían haber otros factores que influyen en el número de víctimas.
Min Media Mediana Desviación Max Q1 Q3
1 2 32.875 33 20.52001 77 19.5 45.25
Un rango de valores muy amplio (de 2% a 77%) indica que hay departamentos con muy bajo porcentaje de población rural y otros con muy alto porcentaje de población rural. Esto sugiere una gran variedad en las poblaciones rurales de los departamentos.
La media de 32.875 indica que el porcentaje de población rural por departamento tiende a concentrarse alrededor de 33%.
Una mediana de 33% indica que la mitad de los departamentos tienen un porcentaje de población rural menor o igual a 33%, lo que sugiere que la mayoría de los departamentos tiene un porcentaje de población rural relativamente bajo.
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
La distancia entre Q1 y Q3 es bastante grande (26%), lo que indica que
hay una significativa variación en el porcentaje de población rural
entre los departamentos.
El que no haya puntos fuera de las cajas, eso sugiere que la mayoría de los departamentos tienen porcentajes de población rural dentro del mismo rango. Esto podría ser debido a que muchos departamentos peruanos tienen un porcentaje similar de población rural.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas.
El gráfico nos indicaría una correlación negativa.Reallizaremos la
prueba de correlación para saber la fuerza de la correlación
Pearson's product-moment correlation
data: data$VICTIMAS and data$RURAL
t = -1.9975, df = 22, p-value = 0.05828
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.68668087 0.01374973
sample estimates:
cor
-0.3918202
Dado que el p-valor es mayor a 0.05, aceptamos la H0. Por lo tanto, podemos afirmar que no existe correlación entre el porcentaje de población rural según departamento y el número de víctimas de trata de personas en el 2017.
Min Media Mediana Desviación Max Q1 Q3
1 9.3 48.05217 48.6 21.5068 83 33.55 66.35
Este resultado quiere decir que el porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo en el 2017 de todos los departamentos analizados es de 48. Igualmente, la mediana es 49%, lo cual nos indica que no hay datos extremos que alteren el promedio.Además, quiere decir que, hasta la mitad de departamentos analizados tienen un porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo de hasta 49%. Un rango de valores muy amplio (9.3 a 83%) indica que hay departamentos con un porcentaje muy bajo de habitantes que pertenecen a un nivel socioeconómico muy bajo y otros con un porcentaje muy alto. Esto sugiere una gran variedad en los niveles socioeconómicos entre los departamentos. En este caso, la desviación es de 21.51 esto quiere decir que cada departamento se encuentra en promedio a 27% de la media.
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
La distancia entre Q1 y Q3 es bastante grande (33%), lo que indica que
hay mucha variación en los porcentajes de habitantes que pertenecen a un
nivel socioeconómico muy bajo entre los departamentos.
El punto del centro (mediana) está un poco más lejos de la mitad superior del rango de valores, lo que sugiere que la mayoría de los departamentos no tiene un porcentaje de habitantes que pertenecen a un nivel socioeconómico muy bajo mayor que el promedio.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas.
A primera vista, el gráfico nos indicaría una correlación
negativa.Realizaremos la prueba de correlación para saber la fuerza de
la correlación
Hipótesis de la correlación H0 = No existe correlación entre el porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo y el número de víctimas de trata de personas en el 2017.
Pearson's product-moment correlation
data: data$VICTIMAS and data$SOCIOECO_MUYBAJO
t = -1.9163, df = 21, p-value = 0.06903
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.68851126 0.03139256
sample estimates:
cor
-0.3858019
Dado que el p-valor es mayor a 0.05, aceptamos la H0. Por lo tanto, podemos afirmar que no existe correlación entre el porcentaje de habitantes que pertencen a un nivel socieconómico muy bajo y el número de víctimas de trata de personas en el 2017.
Min Media Mediana Desviación Max Q1 Q3
1 74.6 84.35833 85.1 4.782206 91.5 81.25 87.55
Este resultado quiere decir que el número promedio aproximado de la tasa neta de asistencia escolar a educación secundaria de la población de 12 a 16 años de edad de todos los departamentos del Perú analizados es 84.
En segundo lugar, calculamos la mediana porque esta medida es más robusta que la media al resistir valores extremos. Una mediana de 85.1 indica que la mitad de los jóvenes asisten a un porcentaje superior o igual al 85% de las clases en la educación secundaria..
Un rango muy pequeño de 74.6 a 91.5 indica que la gran mayoría de los jóvenes entre 12 y 16 años asisten a un alto porcentaje de clases en la educación secundaria. Sin embargo, algunos jóvenes asisten a menos clases.
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
Una distancia de 6.35 entre Q1 y Q3 es bastante pequeña, lo que sugiere
que hay poca variación en el número de clases que los jóvenes asisten en
la educación secundaria. La mediana está un poco más cerca del cuartil 3
que del cuartil 1, lo que sugiere que los jóvenes asisten a un
porcentaje más alto de clases en educación secundaria.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas.
A primera vista, el gráfico nos indicaría una correlación
positiva.Realizaremos la prueba de correlación para saber la fuerza de
la correlación
Pearson's product-moment correlation
data: data$VICTIMAS and data$ASISTENCIA_SEC
t = 0.71533, df = 22, p-value = 0.4819
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.2689901 0.5223918
sample estimates:
cor
0.1507662
Dado que el p-valor es mayor a 0.05, aceptamos la H0. Por lo tanto, podemos afirmar que no existe correlación entre la tasa neta de asistencia escolar a educación secundaria de la población de 12 a 16 años de edad, y el número de víctimas de trata de personas en el 2017.
Min Media Mediana Desviación Max Q1 Q3
1 39.8 46.8125 46.7 3.741694 54.8 43.925 49.45
Una media de 46.8 significa que, en promedio, el 47% de la mujer económicamente activa tiene empleo.
Un rango de valores relativamente pequeño (39.8 a 54.8) indica que la mayoría de los departamentos tienen un porcentaje similar de mujeres económicamente activas ocupadas. Una mediana de 46.7 significa que la mitad de los departamentos tienen un porcentaje de mujeres ocupadas superior o igual al 47%,
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
La distancia entre Q1 y Q3 es bastante pequeña (5.525), lo que sugiere
que hay poca variación en el porcentaje de mujeres económicamente
activas ocupadas entre los departamentos. Como no hay valores atípicos,
todos los valores de porcentaje de mujeres económicamente activas
ocupadas están dentro del rango esperado. Esto refuerza la idea de que
hay una gran similitud en los porcentajes de mujeres ocupadas entre los
departamentos.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas.
A primera vista, el gráfico nos indicaría una correlación
negativa.Realizaremos la prueba de correlación para saber la fuerza de
la correlación
Pearson's product-moment correlation
data: data$VICTIMAS and data$PEAOCUPADA_FEM
t = -1.0072, df = 22, p-value = 0.3248
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5654628 0.2113374
sample estimates:
cor
-0.2099589
Dado que el p-valor es mayor a 0.05, aceptamos la H0. Por lo tanto, podemos afirmar que no existe correlación entre la tasa de población económicamente activa ocupada femenina y el número de víctimas de trata de personas en el 2017.
Min Media Mediana Desviación Max Q1 Q3
1 612 3868.667 2486.5 5668.184 28550 1415.25 3800.5
Una media de 3869 significa que, en promedio, 3869 casos de violencia son reportados en los CEM de cada departamento del Perú.
Un rango de valores extremadamente amplio (612 a 28550) indica que hay departamentos con un número muy bajo de casos de violencia reportados y otros con un número muy alto. Esto sugiere que hay una gran variedad en el número de casos reportados entre los CEM.
Grafiquemos
Generemos el gráfico que mejor permite ver estas medidas de posición
Una distancia de 2485 entre Q1 y Q3 significa que hay gran variación en
el número de casos reportados en los CEM.
El punto atípico, que corresponde a Lima y sus 28550 casos de violencia reportados, equivale a un número extremadamente alto de casos de violencia reportados. Este punto podría indicar que hay un problema particular en ese departamento en cuanto a violencia contra la mujer.
Gráfico de dispersión
Visualizamos la relación entre dos variables cuantitativas.
A primera vista, el gráfico nos indicaría una correlación
positiva.Realizaremos la prueba de correlación para saber la fuerza de
la correlación
Pearson's product-moment correlation
data: data$VICTIMAS and data$CASOSCEM
t = 9.0605, df = 22, p-value = 7.042e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.7552079 0.9508302
sample estimates:
cor
0.8880589
Dado que el p-valor es menor a 0.05, rechazamos la H0. Por lo tanto, podemos afirmar que existe correlación entre los casos de violencia reportados en los CEM y el número de víctimas de trata de personas en el 2017.
El coeficiente es de 0.89, por lo tanto se trata de una relación positiva (i), y de fuerza grande (ii).
Esto quiere decir que a medida que los casos de violencia reportados en los CEM aumenta, lo mismo sucede con el número de víctimas de trata de personas.
Esta correlación significativa indica que los casos de violencia reportados en los CEM son un indicador importante para la trata de personas. Podría ser importante para los centros que estén haciendo un esfuerzo por mejorar la detección y la prevención de la violencia contra la mujer.
Ajustar el modelo de regresión para porcentaje de población femenina y victimas de la trata de personas
Call:
lm(formula = VICTIMAS ~ MUJERES, data = data)
Residuals:
Min 1Q Median 3Q Max
-38.682 -26.780 -16.352 9.514 189.693
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -218.269 555.218 -0.393 0.698
MUJERES 5.178 11.104 0.466 0.646
Residual standard error: 48.59 on 22 degrees of freedom
Multiple R-squared: 0.009789, Adjusted R-squared: -0.03522
F-statistic: 0.2175 on 1 and 22 DF, p-value: 0.6455
Ajustar el modelo de regresión para porcentaje de población inmigrante y victimas de la trata de personas
Call:
lm(formula = VICTIMAS ~ INMIGRANTES, data = data)
Residuals:
Min 1Q Median 3Q Max
-26.368 -20.661 -6.041 12.951 59.287
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.2303 5.7880 4.532 0.000203 ***
INMIGRANTES 4.1380 0.5323 7.773 1.81e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 25.31 on 20 degrees of freedom
(2 observations deleted due to missingness)
Multiple R-squared: 0.7513, Adjusted R-squared: 0.7389
F-statistic: 60.43 on 1 and 20 DF, p-value: 1.812e-07
Ajustar el modelo de regresión para porcentaje de población rural y
victimas de la trata de persona
Call:
lm(formula = VICTIMAS ~ RURAL, data = data)
Residuals:
Min 1Q Median 3Q Max
-48.365 -30.248 -2.009 9.540 166.221
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 70.6027 17.5874 4.014 0.000582 ***
RURAL -0.9119 0.4565 -1.998 0.058283 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 44.92 on 22 degrees of freedom
Multiple R-squared: 0.1535, Adjusted R-squared: 0.115
F-statistic: 3.99 on 1 and 22 DF, p-value: 0.05828
Call:
lm(formula = VICTIMAS ~ SOCIOECO_MUYBAJO, data = data)
Residuals:
Min 1Q Median 3Q Max
-62.743 -21.640 -5.295 7.766 159.277
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 83.7539 23.6359 3.543 0.00192 **
SOCIOECO_MUYBAJO -0.8635 0.4506 -1.916 0.06903 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 45.45 on 21 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.1488, Adjusted R-squared: 0.1083
F-statistic: 3.672 on 1 and 21 DF, p-value: 0.06903
Call:
lm(formula = VICTIMAS ~ ASISTENCIA_SEC, data = data)
Residuals:
Min 1Q Median 3Q Max
-47.38 -22.16 -13.97 13.01 188.59
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -86.382 177.823 -0.486 0.632
ASISTENCIA_SEC 1.506 2.105 0.715 0.482
Residual standard error: 48.27 on 22 degrees of freedom
Multiple R-squared: 0.02273, Adjusted R-squared: -0.02169
F-statistic: 0.5117 on 1 and 22 DF, p-value: 0.4819
Call:
lm(formula = VICTIMAS ~ PEAOCUPADA_FEM, data = data)
Residuals:
Min 1Q Median 3Q Max
-45.502 -24.712 -8.283 8.268 186.034
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 166.07 124.92 1.329 0.197
PEAOCUPADA_FEM -2.68 2.66 -1.007 0.325
Residual standard error: 47.74 on 22 degrees of freedom
Multiple R-squared: 0.04408, Adjusted R-squared: 0.000632
F-statistic: 1.015 on 1 and 22 DF, p-value: 0.3248
Call:
lm(formula = VICTIMAS ~ CASOSCEM, data = data)
Residuals:
Min 1Q Median 3Q Max
-21.444 -16.132 -7.328 8.847 53.963
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.168e+01 5.586e+00 2.091 0.0483 *
CASOSCEM 7.482e-03 8.258e-04 9.060 7.04e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 22.45 on 22 degrees of freedom
Multiple R-squared: 0.7886, Adjusted R-squared: 0.779
F-statistic: 82.09 on 1 and 22 DF, p-value: 7.042e-09
Ya que fueron las variables independientes “INMIGRANTES” y “CASOSCEM” las que resultaron con correlación significativa, se las está usando para el modelo.
Ahora…..¿El modelo es valido? ANOVA
Call:
lm(formula = VICTIMAS ~ INMIGRANTES + CASOSCEM, data = data)
Residuals:
Min 1Q Median 3Q Max
-22.840 -16.468 -6.547 5.200 50.701
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15.880089 7.127706 2.228 0.0382 *
INMIGRANTES 1.204899 1.432602 0.841 0.4108
CASOSCEM 0.005485 0.002519 2.178 0.0422 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 23.23 on 19 degrees of freedom
(2 observations deleted due to missingness)
Multiple R-squared: 0.801, Adjusted R-squared: 0.7801
F-statistic: 38.24 on 2 and 19 DF, p-value: 2.183e-07
En este caso, al obtener un p-valor menor/mayor a 0.05 podemos rechazar/aceptar la hipótesis nula, concluyendo que nuestro modelo sí/NO es válido.
Call:
glm(formula = VICTIMAS ~ INMIGRANTES + CASOSCEM, family = poisson,
data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.137e+00 5.558e-02 56.438 < 2e-16 ***
INMIGRANTES -2.985e-02 7.960e-03 -3.750 0.000177 ***
CASOSCEM 1.336e-04 1.505e-05 8.877 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 856.41 on 21 degrees of freedom
Residual deviance: 321.48 on 19 degrees of freedom
(2 observations deleted due to missingness)
AIC: 439.35
Number of Fisher Scoring iterations: 5
(Intercept) INMIGRANTES CASOSCEM
23.0319126 0.9705909 1.0001336
CONCLUSIONES:
Por un lado, el porcentaje de asistencia a la educación secundaria es alto en la mayoría de los departamentos. Esto podría ser un factor que ayuda a explicar el número de víctimas de trata de personas, ya que los estudios han sugerido que la educación puede reducir la vulnerabilidad a la trata de personas.
Asimsimo, existe una gran similitud en la participación laboral de las mujeres entre los departamentos. Esto podría significar que la situación económica de las mujeres no tiene un impacto significativo en el número de víctimas de trata de personas. No obstante, los números de casos de violencia reportados en los CEM varían mucho entre los departamentos. Esto podría explicar en parte el número de víctimas de trata de personas, ya que las mujeres víctimas de violencia tienen un mayor riesgo de ser victimizadas por la trata.
De igual forma, existe una correlación significativa entre los números de casos de violencia reportados en los CEM y el número de víctimas de trata de personas. Esto sugiere que los CEM pueden ser una buena fuente de información para identificar víctimas de trata de personas y que están bien posicionados para proporcionar apoyo a las víctimas.
A partir de los datos obenidos,se realizará las respectivas modelaciones múltiples y simples. Aquí podríamos dividir las variables como que del tipo “DEMOGRAFICAS”, “ECONOMICAS”, etc., para poder realizar un analisis más completo. Se espera que las variables económicas no sean las únicas que justifiquen el aumento o disminución de la trata de personas por departamento.
Por otro lado, algunas conlusiones y sugerencias para la gestión y políticas públicas son las siguientes:
Debido a la gran variación entre los departamentos en los números de casos de violencia reportados en los CEM, se puede sugerir que se necesitan recursos específicos para gestionar y supervisar los CEM en los departamentos con mayor número de casos.
Aunque la correlación por poco no llega a ser significativa entre inmigración y trata de personas, puede ser útil crear políticas públicas que brinden apoyo especializado para inmigrantes y refugiados, incluyendo programas de prevención y apoyo para víctimas de trata.
Se supone que la población rural tiene más posibilidades de ser propensa a ser victimas de la trata de personas como consecuencia colateral del problema de la centralización, fuerza y alcance del estado para con dichas regiones.
Por eso, es importante reconocer la centralidad del estado en la investigación de la trata de personas y desarrollar políticas públicas que hagan hincapié en el estado como un actor clave para proteger a los ciudadanos y hacer más eficiente el sistema judicial. Ya que, el debilitamiento de la institucionalidad estatal y la carencia de eficacia judicial que sufren los países con débiles instituciones estatales, como es en el caso de Perú, puede obstaculizar la investigación y castigo de delitos de trata.
Por ello, se debe involucrar a las comunidades rurales en la prevención de la trata de personas. Proporcionar educación sobre los riesgos de la trata de personas y dar a los residentes de las áreas rurales las habilidades necesarias para evitar caer en trampas de trata.
Por último, es importante recordar que la trata de personas es un problema transnacional. Por lo que, es importante desarrollar asociaciones regionales para la prevención y el combate de la trata de personas. La cooperación internacional es fundamental para rastrear a los traficantes y proteger a las víctimas de trata de personas.
RLS
Call:
lm(formula = VICTIMAS ~ MUJERES, data = data)
Residuals:
Min 1Q Median 3Q Max
-38.682 -26.780 -16.352 9.514 189.693
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -218.269 555.218 -0.393 0.698
MUJERES 5.178 11.104 0.466 0.646
Residual standard error: 48.59 on 22 degrees of freedom
Multiple R-squared: 0.009789, Adjusted R-squared: -0.03522
F-statistic: 0.2175 on 1 and 22 DF, p-value: 0.6455
Call:
lm(formula = VICTIMAS ~ INMIGRANTES, data = data)
Residuals:
Min 1Q Median 3Q Max
-26.368 -20.661 -6.041 12.951 59.287
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.2303 5.7880 4.532 0.000203 ***
INMIGRANTES 4.1380 0.5323 7.773 1.81e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 25.31 on 20 degrees of freedom
(2 observations deleted due to missingness)
Multiple R-squared: 0.7513, Adjusted R-squared: 0.7389
F-statistic: 60.43 on 1 and 20 DF, p-value: 1.812e-07
Call:
lm(formula = VICTIMAS ~ EMIGRANTES, data = data)
Residuals:
Min 1Q Median 3Q Max
-56.27 -26.20 -12.39 12.91 175.42
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 20.065 17.854 1.124 0.273
EMIGRANTES 5.066 3.714 1.364 0.186
Residual standard error: 46.89 on 22 degrees of freedom
Multiple R-squared: 0.07798, Adjusted R-squared: 0.03607
F-statistic: 1.861 on 1 and 22 DF, p-value: 0.1863
Call:
lm(formula = VICTIMAS ~ URBANO, data = data)
Residuals:
Min 1Q Median 3Q Max
-48.365 -30.248 -2.009 9.540 166.221
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -20.5843 31.9854 -0.644 0.5265
URBANO 0.9119 0.4565 1.998 0.0583 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 44.92 on 22 degrees of freedom
Multiple R-squared: 0.1535, Adjusted R-squared: 0.115
F-statistic: 3.99 on 1 and 22 DF, p-value: 0.05828
Call:
lm(formula = VICTIMAS ~ RURAL, data = data)
Residuals:
Min 1Q Median 3Q Max
-48.365 -30.248 -2.009 9.540 166.221
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 70.6027 17.5874 4.014 0.000582 ***
RURAL -0.9119 0.4565 -1.998 0.058283 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 44.92 on 22 degrees of freedom
Multiple R-squared: 0.1535, Adjusted R-squared: 0.115
F-statistic: 3.99 on 1 and 22 DF, p-value: 0.05828
Call:
lm(formula = VICTIMAS ~ SOCIOECO_MUYBAJO, data = data)
Residuals:
Min 1Q Median 3Q Max
-62.743 -21.640 -5.295 7.766 159.277
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 83.7539 23.6359 3.543 0.00192 **
SOCIOECO_MUYBAJO -0.8635 0.4506 -1.916 0.06903 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 45.45 on 21 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.1488, Adjusted R-squared: 0.1083
F-statistic: 3.672 on 1 and 21 DF, p-value: 0.06903
Call:
lm(formula = VICTIMAS ~ ASISTENCIA_SEC, data = data)
Residuals:
Min 1Q Median 3Q Max
-47.38 -22.16 -13.97 13.01 188.59
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -86.382 177.823 -0.486 0.632
ASISTENCIA_SEC 1.506 2.105 0.715 0.482
Residual standard error: 48.27 on 22 degrees of freedom
Multiple R-squared: 0.02273, Adjusted R-squared: -0.02169
F-statistic: 0.5117 on 1 and 22 DF, p-value: 0.4819
Call:
lm(formula = VICTIMAS ~ PEAOCUPADA_FEM, data = data)
Residuals:
Min 1Q Median 3Q Max
-45.502 -24.712 -8.283 8.268 186.034
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 166.07 124.92 1.329 0.197
PEAOCUPADA_FEM -2.68 2.66 -1.007 0.325
Residual standard error: 47.74 on 22 degrees of freedom
Multiple R-squared: 0.04408, Adjusted R-squared: 0.000632
F-statistic: 1.015 on 1 and 22 DF, p-value: 0.3248
Call:
lm(formula = VICTIMAS ~ CASOSCEM, data = data)
Residuals:
Min 1Q Median 3Q Max
-21.444 -16.132 -7.328 8.847 53.963
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.168e+01 5.586e+00 2.091 0.0483 *
CASOSCEM 7.482e-03 8.258e-04 9.060 7.04e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 22.45 on 22 degrees of freedom
Multiple R-squared: 0.7886, Adjusted R-squared: 0.779
F-statistic: 82.09 on 1 and 22 DF, p-value: 7.042e-09
Call:
lm(formula = VICTIMAS ~ ASISTENCIA_SUP, data = data)
Residuals:
Min 1Q Median 3Q Max
-36.388 -26.004 -19.095 9.445 193.391
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 54.2198 48.8114 1.111 0.279
ASISTENCIA_SUP -0.2156 0.7578 -0.284 0.779
Residual standard error: 48.74 on 22 degrees of freedom
Multiple R-squared: 0.003665, Adjusted R-squared: -0.04162
F-statistic: 0.08093 on 1 and 22 DF, p-value: 0.7787
RLM
Luego de realizadas las correlaciones y RLS, podemos escoger las variables adecuadas para modelar la RLM
Modelo empleando todas las variables independientes válidas
Call:
lm(formula = VICTIMAS ~ INMIGRANTES + SOCIOECO_MUYBAJO + ASISTENCIA_SEC +
CASOSCEM + ASISTENCIA_SUP, data = data)
Residuals:
Min 1Q Median 3Q Max
-21.736 -15.069 -6.026 3.093 52.495
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.374165 132.118444 0.079 0.9385
INMIGRANTES 0.681923 1.818559 0.375 0.7129
SOCIOECO_MUYBAJO -0.125803 0.334885 -0.376 0.7124
ASISTENCIA_SEC 0.475726 1.802778 0.264 0.7955
CASOSCEM 0.006044 0.003015 2.005 0.0634 .
ASISTENCIA_SUP -0.443972 0.667804 -0.665 0.5163
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 25.23 on 15 degrees of freedom
(3 observations deleted due to missingness)
Multiple R-squared: 0.8087, Adjusted R-squared: 0.7449
F-statistic: 12.68 on 5 and 15 DF, p-value: 6.055e-05
MUJERES INMIGRANTES EMIGRANTES URBANO RURAL SOCIOECO_MUYBAJO
MUJERES 1.00 0.23 0.63 -0.20 0.20 0.02
INMIGRANTES 0.23 1.00 0.32 0.36 -0.36 -0.43
EMIGRANTES 0.63 0.32 1.00 -0.46 0.46 0.36
URBANO -0.20 0.36 -0.46 1.00 -1.00 -0.89
RURAL 0.20 -0.36 0.46 -1.00 1.00 0.89
SOCIOECO_MUYBAJO 0.02 -0.43 0.36 -0.89 0.89 1.00
ASISTENCIA_SEC 0.19 0.15 -0.14 0.22 -0.22 -0.47
PEAOCUPADA_FEM 0.59 -0.20 0.55 -0.84 0.84 0.69
CASOSCEM 0.33 0.94 0.42 0.30 -0.30 -0.39
ASISTENCIA_SUP 0.00 -0.08 -0.34 0.16 -0.16 -0.38
VICTIMAS 0.07 0.87 0.28 0.38 -0.38 -0.38
ASISTENCIA_SEC PEAOCUPADA_FEM CASOSCEM ASISTENCIA_SUP VICTIMAS
MUJERES 0.19 0.59 0.33 0.00 0.07
INMIGRANTES 0.15 -0.20 0.94 -0.08 0.87
EMIGRANTES -0.14 0.55 0.42 -0.34 0.28
URBANO 0.22 -0.84 0.30 0.16 0.38
RURAL -0.22 0.84 -0.30 -0.16 -0.38
SOCIOECO_MUYBAJO -0.47 0.69 -0.39 -0.38 -0.38
ASISTENCIA_SEC 1.00 -0.02 0.21 0.75 0.15
PEAOCUPADA_FEM -0.02 1.00 -0.07 0.01 -0.21
CASOSCEM 0.21 -0.07 1.00 0.04 0.89
ASISTENCIA_SUP 0.75 0.01 0.04 1.00 -0.06
VICTIMAS 0.15 -0.21 0.89 -0.06 1.00
En primer lugar, la EFA requiere verificar si los datos permiten
factorizar
Kaiser-Meyer-Olkin factor adequacy
Call: psych::KMO(r = corMatrix)
Overall MSA = 0.67
MSA for each item =
MUJERES INMIGRANTES EMIGRANTES URBANO
0.36 0.68 0.65 0.76
RURAL SOCIOECO_MUYBAJO ASISTENCIA_SEC PEAOCUPADA_FEM
0.76 0.90 0.60 0.65
CASOSCEM ASISTENCIA_SUP VICTIMAS
0.67 0.42 0.64
En segundo lugar, verificamos si la matriz de correlaciones es adecuada
Aquí hay dos pruebas:
[1] FALSE
Después de aplicar la prueba, podemos rechazar la hipótesis nula y afirmar que la matriz de correlación no es una matriz identidad.
[1] TRUE
Después de realizar la prueba, aceptamos la hipótesis nula y podemos afirmar que la matriz de correlación es una matriz singular
En tercer lugar, determinar en cuántos factores o variables latentes podríamos reducir la data para identificar sus componentes básicos o principales
Parallel analysis suggests that the number of factors = 3 and the number of components = NA
Las ponderaciones estimadas para las puntuaciones factoriales son probablemente incorrectas, pues como ya comprombamos la matriz no es adecuada. Sin embargo, continuaremos con el proceso.
Se sugieren 3, contrario a la teoria.
Redimensionamos a un número menor de factores
Loadings:
MR1 MR2
MUJERES 0.348 0.437
INMIGRANTES -0.209 0.896
EMIGRANTES 0.611 0.558
URBANO -0.939 0.224
RURAL 0.939 -0.224
SOCIOECO_MUYBAJO 0.854 -0.325
ASISTENCIA_SEC -0.271 0.176
PEAOCUPADA_FEM 0.872
CASOSCEM -0.130 0.989
ASISTENCIA_SUP -0.266
VICTIMAS -0.241 0.812
MR1 MR2
SS loadings 4.013 3.185
Proportion Var 0.365 0.290
Cumulative Var 0.365 0.654
Mejoramos el resultado, ya que hay más de un factor
Loadings:
MR1 MR2
MUJERES
INMIGRANTES 0.896
EMIGRANTES 0.611 0.558
URBANO -0.939
RURAL 0.939
SOCIOECO_MUYBAJO 0.854
ASISTENCIA_SEC
PEAOCUPADA_FEM 0.872
CASOSCEM 0.989
ASISTENCIA_SUP
VICTIMAS 0.812
MR1 MR2
SS loadings 4.013 3.185
Proportion Var 0.365 0.290
Cumulative Var 0.365 0.654
Resultado visual
Logramos que cada variable se vaya a un factor para obtener una estructura simple
Cambiamos de sus rangos. Elejimos un rango del 0 al 1.
Otra estrategia sería tipificarla. Como se muestra a continuación:
Nos quedaremos con esta opción y veremos las correlaciones entre esas
variables tipificadas.
MUJERES INMIGRANTES EMIGRANTES URBANO RURAL
MUJERES 1.00000000 NA 0.6437818 -0.1499779 0.1499779
INMIGRANTES NA 1 NA NA NA
EMIGRANTES 0.64378178 NA 1.0000000 -0.4036391 0.4036391
URBANO -0.14997795 NA -0.4036391 1.0000000 -1.0000000
RURAL 0.14997795 NA 0.4036391 -1.0000000 1.0000000
SOCIOECO_MUYBAJO NA NA NA NA NA
ASISTENCIA_SEC 0.20740630 NA -0.1010285 0.2450254 -0.2450254
PEAOCUPADA_FEM 0.56212489 NA 0.5349694 -0.8346521 0.8346521
CASOSCEM 0.35201379 NA 0.4253796 0.3126874 -0.3126874
ASISTENCIA_SUP -0.01376288 NA -0.3397866 0.1608940 -0.1608940
SOCIOECO_MUYBAJO ASISTENCIA_SEC PEAOCUPADA_FEM CASOSCEM
MUJERES NA 0.20740630 0.562124886 0.35201379
INMIGRANTES NA NA NA NA
EMIGRANTES NA -0.10102847 0.534969415 0.42537963
URBANO NA 0.24502544 -0.834652144 0.31268744
RURAL NA -0.24502544 0.834652144 -0.31268744
SOCIOECO_MUYBAJO 1 NA NA NA
ASISTENCIA_SEC NA 1.00000000 -0.029710731 0.21579718
PEAOCUPADA_FEM NA -0.02971073 1.000000000 -0.06963989
CASOSCEM NA 0.21579718 -0.069639890 1.00000000
ASISTENCIA_SUP NA 0.73394982 -0.004608238 0.02839493
ASISTENCIA_SUP
MUJERES -0.013762881
INMIGRANTES NA
EMIGRANTES -0.339786642
URBANO 0.160893965
RURAL -0.160893965
SOCIOECO_MUYBAJO NA
ASISTENCIA_SEC 0.733949822
PEAOCUPADA_FEM -0.004608238
CASOSCEM 0.028394931
ASISTENCIA_SUP 1.000000000
Como hay correlaciones negativas sería bueno invertir el rango…